De la PME à l’entreprise du CAC 40, la valorisation de la donnée est au cœur des préoccupations, du fait qu’elle représente un avantage concurrentiel. En mettant sur le marché des outils de plus en plus performants, les éditeurs de la BI moderne (ou BI agile pour certains), répondent d’un côté aux exigences métiers (self-service BI) et de l’autre, aux contraintes budgétaires de la DSI. Non seulement ces outils excellent dans la data visualisation, mais encore, ils sont présents dans le Cloud afin de maintenir les coûts ; enfin, ils sont capables de se connecter aussi bien aux sources de données structurées que non structurées (Open Data, Big Data, etc.). La nouveauté est que ces outils se lancent dans l’analyse prédictive de la donnée, un domaine auparavant consacré à des éditeurs comme SAS ou IBM.
L’objectif de cet article est de montrer comment les outils BI abordent la question de l’analyse avancée, notamment l’analyse des Big Data, sans toutefois dresser un benchmark de l’ensemble des outils BI disponibles sur le marché. C’est pourquoi, nous nous focaliserons uniquement sur des outils, ayant un engouement croissant sur le marché français: Birst, MicroStrategy, Power BI, QlikView, Spotfire, et Tableau.
Nous sommes conscients que cette liste n’est pas exhaustive, sachant que les éditeurs peuvent décliner leur outil en différentes versions, plus ou moins similaires, comme c’est le cas pour Qlik avec QlikView et QlikSense.
L’objectif de cet article est de montrer comment les outils BI abordent la question de l’analyse avancée, notamment l’analyse des Big Data, sans toutefois dresser un benchmark de l’ensemble des outils BI disponibles sur le marché. C’est pourquoi, nous nous focaliserons uniquement sur des outils, ayant un engouement croissant sur le marché français: Birst, MicroStrategy, Power BI, QlikView, Spotfire, et Tableau.
Nous sommes conscients que cette liste n’est pas exhaustive, sachant que les éditeurs peuvent décliner leur outil en différentes versions, plus ou moins similaires, comme c’est le cas pour Qlik avec QlikView et QlikSense.
Connectivité aux sources Big Data : un pari réussi
L’argument souvent avancé par les éditeurs BI est la capacité à se connecter à des sources de données multiples, notamment aux sources Big Data. MicroStrategy et Tableau, avec l’ergonomie de leur interface, gagnent ce pari « haut la main » en proposant, d’une manière intuitive, une large gamme de connecteurs pouvant exploiter l’ensemble des bases de données de type Hadoop. A l’exception de TIBCO Spotfire, ces outils permettent d’accéder aux bases de données publiques (Open Data) comme celle de l’INSEE ou d’Eurostat. QlikView permet une connexion aux sources avec un driver ODBC. Power BI a quant à lui l’avantage de pouvoir se connecter nativement aux différents produits Microsoft, comme Microsoft Azure HDInsight ou Microsoft Azure Data Lake Store.
Au-delà de la connectivité aux sources non relationnelles, la transformation des données à l’importation est aussi un point que nous avons testé. Birst, Tableau, MicroStrategy, et Power BI offrent cette possibilité avec un léger avantage pour MicroStrategy et Power BI. Cela ouvre la voie pour l’utilisateur métier d’exploiter des données brutes sans devoir forcément passer par la DSI.
Au-delà de la connectivité aux sources non relationnelles, la transformation des données à l’importation est aussi un point que nous avons testé. Birst, Tableau, MicroStrategy, et Power BI offrent cette possibilité avec un léger avantage pour MicroStrategy et Power BI. Cela ouvre la voie pour l’utilisateur métier d’exploiter des données brutes sans devoir forcément passer par la DSI.
Tableau 1. Outils BI et connectivité BIG DATA
Advanced Analytics : des performances avérées
Selon le Gartner, d’ici 2020, l’analyse avancée attirera 40 % des nouveaux investissements des entreprises en matière de business intelligence et d’analyse. Celle-ci est définie comme l’ensemble des techniques de statistique descriptive et prédictive (Data Mining, Machine Learning, etc.) qui permettent d’aller au-delà des résultats de la BI traditionnelle.
Quand il s’agit de l’analyse avancée, l’efficacité des outils comme SAS, IBM, KNIME, et rapidMiner est indéniable. La tendance montre que ceux-ci sont fortement concurrencés par des outils BI et Data visualisation qui proposent d’ajouter de l’analyse prédictive à leur dashboard.
Nos tests confirment cette volonté. Le point commun est que ces outils font appel au langage R, qui est un langage statistique open source super puissant. Même si les éditeurs ont développé une interface graphique permettant d’accéder aux différents tests statistiques, la compétence en programmation avec le langage R est fortement recommandée. Cette compétence est même primordiale, si l’on souhaite faire de l’analyse avancée avec MicroStrategy, Qlikview, Tableau, Birst et Power BI.
Dans le domaine de l’analyse avancée, c’est TIBCO Spotfire qui affiche les meilleures performances : il intègre TIBCO Enterprise Runtime for R (TERR), un moteur d’analyse commercial se voulant plus robuste que le langage open Source R, complété avec TIBCO Spotfire Statistics Services. Cette présence analytique lui a permis de proposer une large gamme de modèles prédictifs et de tests statistiques sans recourir au développement. Le langage R peut quant à lui être utilisé pour explorer des modèles qui sont absents de l’interface graphique.
Pour parvenir à faire de l’analyse prédictive ou descriptive avec les cinq autres produits, nous devrons forcément passer par la phase développement dans l’éditeur de mesures. A chaque éditeur ses spécificités. L’avantage de MicroStrategy est qu’il s’appuie sur une communauté développant des packages R et des scripts, utilisables directement dans l’éditeur de mesures (Rintegrationpack.codeplex)(1) ; il n’est donc pas nécessaire de connaitre le langage R pour exploiter des algorithmes de Machine Learning, par exemple. Son inconvénient est de rester limité à des algorithmes déjà développés. Power BI est le seul à intégrer un éditeur de scripts R. Cela peut convenir à des utilisateurs qui maitrisent déjà le langage. QlikView ne déroge pas à la règle en s’appuyant sur Rattle (the R Analytical Tool To Learn Easily), une interface graphique permettant de faire de l’analyse prédictive.
(1) Les Algorithmes déjà développés pour MicroStrategy sont : ARIMA, Seasonal Forecasting, Stepwise Regression, Survival Analysis, k Nearest Neighbors, Neural Network, Naive Bayes, Random Forests, Stepwise Logistic, Regression, k-Means Clustering, k-Medoids, Pairwise Variable, Correlation
Quand il s’agit de l’analyse avancée, l’efficacité des outils comme SAS, IBM, KNIME, et rapidMiner est indéniable. La tendance montre que ceux-ci sont fortement concurrencés par des outils BI et Data visualisation qui proposent d’ajouter de l’analyse prédictive à leur dashboard.
Nos tests confirment cette volonté. Le point commun est que ces outils font appel au langage R, qui est un langage statistique open source super puissant. Même si les éditeurs ont développé une interface graphique permettant d’accéder aux différents tests statistiques, la compétence en programmation avec le langage R est fortement recommandée. Cette compétence est même primordiale, si l’on souhaite faire de l’analyse avancée avec MicroStrategy, Qlikview, Tableau, Birst et Power BI.
Dans le domaine de l’analyse avancée, c’est TIBCO Spotfire qui affiche les meilleures performances : il intègre TIBCO Enterprise Runtime for R (TERR), un moteur d’analyse commercial se voulant plus robuste que le langage open Source R, complété avec TIBCO Spotfire Statistics Services. Cette présence analytique lui a permis de proposer une large gamme de modèles prédictifs et de tests statistiques sans recourir au développement. Le langage R peut quant à lui être utilisé pour explorer des modèles qui sont absents de l’interface graphique.
Pour parvenir à faire de l’analyse prédictive ou descriptive avec les cinq autres produits, nous devrons forcément passer par la phase développement dans l’éditeur de mesures. A chaque éditeur ses spécificités. L’avantage de MicroStrategy est qu’il s’appuie sur une communauté développant des packages R et des scripts, utilisables directement dans l’éditeur de mesures (Rintegrationpack.codeplex)(1) ; il n’est donc pas nécessaire de connaitre le langage R pour exploiter des algorithmes de Machine Learning, par exemple. Son inconvénient est de rester limité à des algorithmes déjà développés. Power BI est le seul à intégrer un éditeur de scripts R. Cela peut convenir à des utilisateurs qui maitrisent déjà le langage. QlikView ne déroge pas à la règle en s’appuyant sur Rattle (the R Analytical Tool To Learn Easily), une interface graphique permettant de faire de l’analyse prédictive.
(1) Les Algorithmes déjà développés pour MicroStrategy sont : ARIMA, Seasonal Forecasting, Stepwise Regression, Survival Analysis, k Nearest Neighbors, Neural Network, Naive Bayes, Random Forests, Stepwise Logistic, Regression, k-Means Clustering, k-Medoids, Pairwise Variable, Correlation
Tableau 2 : outils BI et Advanced Analytics
Conclusion
Nous avons vu que le choix d’un outil BI peut sembler cornélien. Cependant plusieurs critères peuvent nous orienter : la dimension analytics, principalement, mais aussi les besoins métiers, les ressources disponibles et les objectifs affichés. Chacun devra être défini préalablement avec toute la rigueur nécessaire, car au-delà de la « beauté du geste », un projet BI bien dimensionné est fondamentalement un moyen efficace pour répondre aux questions métiers.
Autres articles
-
Qlik améliore l’intégration avec SAP, Databricks et Snowflake et favorise la création de valeur grâce à l’IA
-
Qlik lève les obstacles à la migration vers le cloud et ouvre la voie à une adoption transparente de l’IA dans tous les secteurs
-
Une entreprise française sur deux réduit ses investissements dans l'IA par manque de confiance
-
La technologie de Qlik favorise l’obtention de résultats plus rapides et en temps réel pour GenWizard d'Accenture
-
Oracle Database@Azure disponible dans de nouvelles régions et avec de nouveaux services pour répondre à la demande mondiale